HarmonyOS-鸿蒙app开发 —基于javaAI语音识别概述

HarmonyOS-鸿蒙app开发 —基于javaAI语音识别概述

语音识别功能提供面向移动终端的语音识别能力。它基于华为智慧引擎(HUAWEI HiAI Engine)中的语音识别引擎,向开发者提供人工智能应用层API。该技术可以将语音文件、实时语音数据流转换为汉字序列,准确率达到90%以上(本地识别95%)。

基本概念

语音识别技术,也称为自动语音识别(Automatic Speech Recognition, ASR),可以基于机器识别和理解,将语音信号转变为文本或命令。

约束与限制

  • 支持的输入文件格式有wav或pcm。
  • 当前仅支持对普通话的识别。
  • 输入时长不能超过20s。
  • 采样要求:采样率16000Hz,单声道。
  • 引擎的使用必须初始化和释放处理,且调用必须在UI的主线程中进行。
  • 多线程调用:HUAWEI HiAI Engine不支持同一应用使用多线程调用同一接口,这样会使某一线程调用release方法后,卸载模型,导致正在运行的另一些线程出错。故多线程执行同一功能达不到并行的效果。但是引擎支持使用多线程调用不同接口,如开启两个线程同时使用文档矫正和ASR接口。
0 0 投票数
文章评分
订阅评论
提醒
0 评论
最旧
最新 最多投票
内联反馈
查看所有评论
0
希望看到您的想法,请您发表评论x